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Uma das maneiras de alhar o oficia de produzir 
informações sociais, econômicas e territoriais é como orte de 
descrever o mundo. Estatísticas e mapas transportam os fenômenos 
da realidade para escalas apropriadas à perspectiva de nossa visão 
humana e nos permitem pensar e agir ò distancia, construindo 
avenidas de mão dupla que juntam o mundo e suas imagens. Maior o 
poder de síntese dessas representações, combinando, com precisão, 
elementos dispersos e heterogêneos do cotidiano, maior o nosso 
conhecimento e o nossa capacidade de compreender e transformar o 
realidade. 

Visto como arte, o ofício de produzir essas informações 
reflete a cultura de um País e de sua época, como essa cultura vê o 
mundo e o forna visível, redefinindo o que vê e o que hd para se ver. 

No cenário de contínua inovação tecnológica e mudança 
de culturas da sociedade contemporânea, as novas tecnologias de 
informação - reunindo computadores, telecomunicações e redes de 
informação - aceleram aquele movimento de mobilização do mundo 
real. Aumenta a velocidade da acumulação de informação e são 
ampliados seus requisitos de atualização, formato - mais flexível, 
personalizado e interativo - e, principalmente, de acessibilidade. A 
plataforma digital vem se consolidando como o meio mais simples, 
barato e poderoso paro tratar a informação, tornando possíveis 
novos produtes e serviços e conquistando novos usuários. 

Acreditamos ser o ambiente de conversa e controvérsia 
e de troca entre as diferentes disciplinas, nas mesas redondas e 
sessões temáticas das Conferências Nacionais de Ceografla, 
Cartografa e Estatística e do Címpásio de Inovações, aquele que 
melhor enseja o aprimoramento do consenso sobre os fenômenos a 
serem mensurados para retratar a sociedade, a economia e o 
Território nacional e sobre as prioridades e formatos das informações 
necessárias para o fortalecimento da cidadania, a definição de 
políticas públicas e a gestão político - administrativa do País, e para 
criar uma sociedade mais Justa. 



Simon Schwartzman 
Coordenador Ceral do ENCONTRO 
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Fundação Instituto Brasileiro de Geografia e Estatística 

IBGE 

Fundação Instituto Brasileiro de Geografia e Estatística 
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Associação Brasileira de Estudos do Trabalho 
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Associação Brasileira de Pós-graduação em Saúde Coletiva 
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Associação Nacional de Centros de Pós-graduação em Economia 
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Associação Nacional de Pós-graduação e Pesquisa em Ciências 
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ANPOCS 

Associação Nacional de Pós-graduação e Pesquisa em Geografia 

ANPEGE 

Associação Nacional de Pós-graduação e Pesquisa em 
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Sociedade Brasileira de Cartografia 
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Conselho Nacional de Pesquisas 
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Instituto do Desenvolvimento Econômico Social do Pará 
IDESP (PA) 

Instituto Geográfico e Cartográfico 
IGC (SP) 

Instituto de Apoio à Pesquisa e ao Desenvolvimento “Jones dos 
Santos Neves” 

IJSN (ES) 

Instituto Paranaense de Desenvolvimento Econômico e Social 
IPARDES (PR) 

Processamento de Dados do Município de Belo Horizonte S/A 
PRODABEL (MG) 

Superintendência de Estudos Econômicos e Sociais da Bahia 
SEI (BA) 
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AMBIENTE GENÉRICO PARA DESENVOLVIMENTO DE APLICAÇÕES PARA 
CAPTURA, CRÍTICA E CODIFICAÇÃO DE DADOS DE PESQUISAS 

ESTATÍSTICAS 



Reina Marta Hanono e 
Dulce Maria Rocha Barbosa 
IBGE - Brasil 



RESUMO: 

0 ambiente permite a geração de aplicações para os processos de captura e 
preparação dos dados de uma pesquisa. As ^licações são geradas em código “C” de modo 
a p«mitir o máximo de portabilidade entre as plataformas. Os recursos ofereddos neste 
ambiente para definição de uma aplicação auxiliam o usmirio na e^ecifícação da lógica da 
aplicação assim como na definição da base de dados da aplicação. Os recursos para testes 
da aplicação permitem que estes possam ser efotuados como uma atividade int^rada à 
especifica^ da mesma. Este ambirate posribilha a incorporação do conhecimento dos 
usuários, produzindo asrim um aumento de qualidade e produtividade no desenvolvimento 
das aplicações assim como uma melhor peifomumce das aplicações geradas. 

PALAVRAS CHAVES: 

Cultura, Codificação, Crítica, Processamento de pesquisas 




1. INTRODUÇÃO 

Os awnços da inforaiática nas últimas décadas deram origm ao aparecimento de 
novas tecnologias para a automação do processam^o de dados estatísticos. Seguindo as 
novas tendências ^ automção, foi proposta no IBGE uma nova estratégia para o 
desenvolvimento de ^licaçõ^ para processam^to de dados de pesqmsas estatísticas 
(captura, codificação e crítica). O objetivo era usar as vantagens desta nova tecnologia que 
permitia a descentralização, portabilidade e integração de modo a trazer o especialista 
temático (o responsável e conhecedor da pesquisa) para o processo de desenvolvimento da 
mesma. Foi dado ô&se apenas às &ses de captura, crítica e codificação de uma pesqu^ 
por serem estas as mais problemáticas devido a erros de espedficação e consumo de 
recursos para t^e e programação (tenço e pessoal). 

Neste novo ambiente os uaiáiios podm gaar, de forma automática, os j»'ogramas 
da aplicação, de modo a serem executados de forma batch ou on-Um e em ambiente 
descentralizado. O usuário deve especificar a descrição do questionário da pesquisa e o 
coigunto de regras de critíca a seron ^licadas, através de ferramentas padronizadas que 
incorporam estas espedfica^es à Base de Metadados da Instituição. Após criadas estas 
espedficações na Base de Metadados, o usuário pode comandar a geração das ^Hcações 
para as difer^es &ses da pesquisa fon^cendo apoias a estratégia de processamoxto a ser 
seguida, uma vez que as informações sobre o didonáiio e r^ras de oitícas sei^ 
automaticamente acessadas da Base de Met^lados. 

Foi realizado um esmdo sobre as :l^ramentas existoites no mercado para goai^ 
automMca de ^fic^ões de proc^samento de dados que atendessem aos requiátos de 
aumento de tpalidade, produtividade e iitt^ração. Como não foi encontrado no mercado 
nenhum pacote que atend^e a todos os requisitos foi desenvolvido no 1BC£ um conjunto 
de ferramentas para atender esses requiâíos. 

Este cozpnto de ferramentas trabalha de forma int^rada, possuindo uma lii^uagem 
de especificação própria chamada CRIPTAX, &zeado o acesso automático às informações 
contidas na Base de Metad^os da Institm^o. 




3. DEFINIÇÃO DOS META-DADOS DE UMA PESQUISA 



- Dicionário da pesquisa: descreve as características físicas dos dados como 
registros, variávds, limites para campos miméricos, relação de códigos válidos para 
variáveis categorizadas e código assodado à representação de ignorado. 

- Regras de arMca: descreve as regras de validação que devem ser aplicadas aos 
dados da p^quisa nas diferentes &ses do processamento. 

As r^ras de crítica são escritas numa forma padrão usando os comando CRIPTAX 
na forma: SE <condiçâo> ©n'ÃO <rfdto>. 

Á condição pode ser composta pela combinaçlb de expressões lógicas e fímções 
CRIPTAX conectadas por opmdores lógicos e relacionais. 

O efeito pode so* formado por um corgunto de comandos de atribuição e os 
comandos ERRO, que ordena a impressão ou dii^Iay das variáveis assodadas ao erro, e o 
comando DESPREZE, que foz com que o registro sendo processado sga abandonado para 
as danais oiticas ^edfícadas. 

- Descrições de cóMgo: descreve o corgunto de códigos e textos para cada uma das 
descrições a serem codifícadas, como por ex«nplo, religião, ocupação, etc. 




4. CARACTERÍSTICAS DAS FERRAMENTAS 



O sistma é coo^osto por um conjuoto de ferramentas para gmçlkt das aplicações 
para as distintas &ses do processamento dos dados uma pesquka como captura, 
codificado e ciitica/correção, incluindo a aplicação para controle do processo. 

Os geradores de aplicações de captura, codificação e controle são ãstemas do tipo 
menu-driven p^mitindo ao usuário a espedficação das características de sua aplicação de 
forma on4vne e independ^e da necessidade de qualquer tipo de jn^ogramado. Estas 
ferramentas foram construídas de um modo integrado e trabalham de forma interativa, no 
IBGE, com o gerenciador de banco de dados TSGBD. As aplicaçõ^ geradas são escritas 
em OPUS, uma linguagem de alto nível assodada zo banco de dados TSGBD. 

O gerador de programas de ctitica/correção, executa em ambí^e maài^ame IBM e 
gera programas em cócfigo “C”. 

D^te modo, o proc^samento das pesquisas pode so: executado num ambiente 
d^artamental. No IB(^ o ambiettte que tem úào usado é o UNIX. Atualmente estamos 
mudando para a arquitetura cliente/servidor usando servidora UNIX e Wir^ows NT, 
incluindo um servidor IBM 9672. 

4.1 DESCRIÇÃO DAS FERRAMENTAS 

CRIPTAX 

É a ferramenta para geração automática de aplicações de oitica/correção que 
pennhe ao usuário, sem grandes conhedmoitos na área de processamento de d^s, 
fôpedfícar o coqunto de regras de crífica que será incorporado à aplicação de (nítica 
gerada. A partir de uma mesma espedficação o sistema gera duas aplicações de crítica: 
uma pata processamento batch e outra para processam^o on-lim. 

Os procedimentos a serem realizados pela aplicaç^ de cdtica são espedfícados em 
linguag^ CRIPTAX. 

Esta linguagem é composta por blocos procedurais delimitados pdos comandos 
PROC <identificação> e FIM < identificação>, onde <identificaçào> é uma palavra 
reservada da linguagem. Estas Proc» podem ser procedimentos pré-definidos(macros), para 
m quais o usuário deve especificar os parâmetros, ou podem ser blocos estruturais onde o 




usuário deve especificar os procedimentos a serem aplicados aos dados. A linguagem 
permite a criação de novos valores para variáveis através de grupamento (intervalo de 
valores de outra variável) ou transformação (combinação de valores de outras variáveis). 
Todas as variável usadas na especificação devem estar definidas no didonário. A 
linguagem permite ainda a incorporação automática ao procedimento de crítica, do conjimto 
das regras de crítica. 

Esta ferramenta trabalha de forma integrada a Base de Metadados da Instituição 
buscando as informações referentes ao didonário do questionário e regras de crítica. 

SISENT 

É o gerador automático de aplicações de captura (entrada de dados) que permite a 
geração de : 

• Bate de dados da pesquisa com base nas informações contidas no didonário; 

• Tdaj para cada tipo de r^istro para digitação dos campos do questionário; 

Cada tela deverá ser formada sonmnte por variávds do mesmo tipo de registro. O 
dstema gera de forma automática os testes para validação de cada campo digitado de 
acordo com as espedfic^ões da variável no didonário. Opdonalmente, o usuário poderá 
ter definido um conjunto r^ras de crítica, em CRIPTAX, a serem usadas como fimções 
de validação na entrada de dados. Neste caso estas fimções serão executadas na aplicação 
g^da quando da digjtaçlb dos campos do questionário. 

• Rotina de acesso ao banco de dados da pesquisa, permitindo a inclusib, exdusão e 
alteração de r^jstros; 

• Programa para execução da ^licação de entrada de dados. 




SISCOD 



É o gemdor de aplicações de codificaç^. O sistema pennite ao usuário a 

espedâcação interativa das características de sua aplicação fazendo a geração de: 

• Base de códigos para cada descrição, com base nas espedâcações das descrições e 
opções de parsmg feitas peio usuário; 

• Teste da codificação; 

• Programa de atualização da base de códigos para cada descrição; 

• Base de dados da pesquisa, baseado nas informares do dicionário (opcional); 

• Aplicação de codificação automática (modo batch); 

• Aplicação de codificação asastida ( modo on^line)\ 

O ástema permite que um coigunío de r^ras de crítica, definidas em CRIPTAX, 
possa ser inoirporado ao procedimento de codificação. Assim, além de achar o código 
assodado na base de có(%os da descriç^ o sistema verificará se este código escolhido 
está 000*6016 com as r^ras de oitíca espedfícadas. 

SISCON 

É o gerador de ^licações de controle que pomite a geração de: 

• Base de controle a partir das e^edfica^es do imiáno; 

• Aplicação de controle, coirposta por rotinas de acesso e atualização da base de controle a 
serem usadas em cada &se do proosssamento dã pesquisa; 

• Programas de emissio de relatórios de controle; 

• Programa g^ente para requisição dos rdatóiios de controle. 




5. MUDANÇAS NO PROCESSO METODOLÓGICO 



A u tilizaç ão deste coqunto de feiraxnentas permitiu a introdução de uma mudança 
na forma de trabalho. Elas p^mitem um desenvolvimento participativo no qual usuários, 
sou grandes conhecimentos de programação, usuários tonáticos da pesquisa, sgam 
diretamente responsávds pela espedfícação das regras de critica, assim como pelas opções 
de parsing a serem us^ias pelas ^licações de codificação. Desta forma, é posrivel a 
incorporação do conhecimento do usuário, sobre critica e codificação, durante a &se de 
desenvolvimento. 

Estes &tos provocam uim mudança na metodologia de trd>alho, e^edalm^e para 
os usuários temáticos da pesquisa, que passam ^ora a ser os re^onsáveis pela corretitude 
da aplicação, ddxando para os técnicos em informática a responsabilidade sobre a 
viabilidade, performance e fiindonalidade da aplicação. 

Foi dado um treinamento especifico para as equipes de desenvolvimento nas 
dif^entes foses do processo. Este consistiu no treinamaoto para espodficação do dicionário 
de dados da pesquisa e do coigunto de r^ras de críticã usando a linffiiagem CRIPTAX. Os 
usuários especialistas em informática foram trdnados para a especificação de programas de 
crítica usando a linguagem CRIPTAX. O período de cada um destes módulos de 
treinamento em média foi de quin^ horas. 

6. VANTAGENS 



Â vantagm de maior inq}ortâncâa neste conjunto de ferramentas é o foto delas 
fozerem a geração das piindpais funções do processam^ito de uma pesquisa, permitindo 
aos usuários, com pouca ou nenhuma experiência em computação, fozerem a espedficação 
dos requisitos de suas aplicações. 

Em resumo podemos dizer que as vantagem oferecidas por este ambiente são: 

• focil aprendizado e utilização; 

• utilização através de menus para os geradores de ^licações de controle, entrada de dados 
e codificação; 

• integrid^e entre as ferramentas, isto é, as especificações e saídas produzidas numa fose 




podem ser usadas pela fase seguinte sem a necessidade de redefinição; 

•desenvoivirnento através de prototipação, permitíndo a incorporado do conhecimento do 
usuário; 

• geração de t^licações portáveis; 

« redução da necessidade de programação, necessária somente para a ^iicação de crifica; 

• redução do tempo de desenvolvimento e manutenção refletindo nos custos; 

• aumento da qualidade; 

• aumento da p^onnance das apH<ações geradas. 

7. USO DAS FERRAMENTAS NO IBGE 

O CRIPTAX foi usado para a geração das sqjlicaçõ^ de ciMca para: 

- C«!So Dmográfico 1991 - ambiente UNIX 
. PNAD 1992, 1993 e 1995 - ambiente UNIX 

- Censo Agropecuário 1995 - ambiente UNIX e WINDOWS NT 

- Cadastro Econômico 1995 - ambiente UNIX 

O SISENT foi usado para geração de qilicações de entrada de dados de várias 
pesquisas mensais, todas em ambiente UNIX: 

-Industrial 

- Produção de Lehe 

- Construção Civil 
-INPC 

O SISCOD foi usado para geraçâto das aplicações de codificação para: 

- C«iso Demográfico 1991 
-PNAD 1992, 1993 e 1995 

- POF 1995 ( «KÜfícaçlk} maiual a partir das bases de códigos) 




8. DESENVOLVIMENTO FUTURO 



O BGE está mudando para uma arquitetura Cliente/Servidor operando com o 
sistema de banco de dados ORACLE. Existe um projeto de migração/adaptação das 
ferramentas para geração de aplicações de entrada de dados, controle e codificação, 
at ualm ente rodando em plataforma UNIX para este novo ambiente, incorporando as 
vantagens gráficas oferecidas por ele, foraecendo-se assim uma interfàce mais amigávd com 
o usuário. 

As ^licações de critica geradas pelo CRIPTAX, são &dlmente transferidas para o 
novo ambiente, uma vez que são ^adas ran código ‘C’ e a rotina (k acesso ao Imco de 
dados da pesquisa é fomedda pelo usuário. Está sendo feita uma análise de custo/beneficio 
sobre a migração do atual g^ador de aplicações de crítica/correçâU), rodando atualmente no 
mcãr^ame IBM, para uma nova vers^ rodando em Windows. 

GLOSSÁRIO: 



codificação - atribuição de um código numérico assodado a um texto; 

funções de validação - rotina em código ‘C’ gerada pelo CRIPTAX a partir de um 

coiyunto de r^ras de critica. Esta rotina recebe como parâmetro o 
nome de uma variável e executa todas as regras de critica 
associadas a ela; 

correçib - alteração do valor de uma variável que é considerado inválido ou 

inconsist^ite de acordo com as regras de critica. A correção pode 
ser manual ou automática; 

r^ra de crítica - condição que detecta um erro para um regstro ou questionário; 

crítica - aplicação de um conjunto de regras de crítica e corr^ões de modo 

a produzir um arquivo ‘limpo’. 
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